Une extension de XQuery pour la recherche textuelle d'information dans des documents XML
نویسندگان
چکیده
Résumé. Nous présentons dans cet article une extension de XQuery que nous avons développée pour interroger le contenu et la structure de documents XML. Cette extension consiste à intégrer dans XQuery le langage NEXI, un sous-ensemble de XPath, défini dans le cadre de l’initiative INEX. Notre proposition est double : (i) équiper NEXI d’une sémantique floue, (ii) intégrer NEXI dans XQuery au moyen d’une métafonction appelée nexi, ayant une requête NEXI comme paramètre, et d’une extension de la clause for de l’opérateur FLWOR de XQuery. De plus, nous décrivons le prototype paramétrable que nous avons développé au dessus de deux moteurs XQuery classiques : Galax et Saxon.
منابع مشابه
DocCat: un composant logiciel de catégorisation de documents et de marquage sémantique XML
Résumé : Cet article présente DocCat un composant logiciel de catégorisation de documents. Cet outil permet de générer des balises sémantiques et de les stocker dans une base de données au format XML. DocCat intègre une méthode d’apprentissage supervisée pour classer des documents texte dans des catégories prédéfinies. Les catégories ainsi induites permettent le balisage du document. L’intérêt ...
متن کاملRecherche d'information XML utilisant un principe de vote
RÉSUMÉ. Cet article décrit une approche pour la recherche d’information dans des collections de documents XML. Cette approche utilise une méthode de vote pour déterminer les éléments XML répondant à une requête. Une requête peut combiner des informations sur le contenu recherché, sur la granularité des éléments recherchés et sur les éléments structurels associés aux concepts recherchés. La méth...
متن کاملCompression de structure XML pour la recherche d'information structurée
RÉSUMÉ. La recherche d’informations dans les documents structurés nécessite le stockage de la structure des documents indexés dans les index. Si de nombreuses méthodes sont connues et largement utilisées pour compresser les index pour les documents plats, le stockage efficient de la structure est peu étudié. Nous présentons une représentation de structure arborescente adaptée à la recherche d’i...
متن کاملPropositions pour la recherche contextuelle d'images dans des documents XML
RÉSUMÉ. Cet article s’inscrit dans le cadre de la recherche d’images dans des documents XML. Ce type de recherche peut utiliser des informations sémantiques en plus des informations visuelles de l’image. Nous nous proposons ici d’explorer des pistes pour la recherche de ces informations sémantiques au sein des documents XML, en supposant qu’une image peut être présentée par les autres éléments ...
متن کاملÉléments pour adapter les systèmes de recherche d'information aux dyslexiques
RÉSUMÉ. La prise en compte des troubles de la communication dans l’utilisation des systèmes de recherche d’information tels qu’on peut en trouver sur le Web est généralement réalisée par des interfaces utilisant des modalités n’impliquant pas la lecture et l’écriture. Peu d’applications existent pour aider l’utilisateur en difficulté dans la modalité textuelle. Nous proposons la prise en compte...
متن کامل